其他
科研(IF:41.307) |Nature Genetics:非酒精性脂肪性肝病的多组学研究
生科云网址:https://www.bioincloud.tech/
编译:微科盟-听雪斋,编辑:微科盟Emma、江舜尧。
微科盟原创微文,欢迎转发转载。
导读非酒精性脂肪肝(NAFL)及其后遗症是日益增长的健康问题。我们对NAFL、肝硬化和肝细胞癌进行了全基因组关联研究,并将研究结果与表达和蛋白质组数据进行了整合。对于NAFL,我们使用了9491个临床病例和从36116个肝脏磁共振图像中提取的质子密度脂肪分数。我们确定了18个与NAFL相关的序列变异,4个与肝硬化相关,并在MTARC1和GPAM中发现了罕见的、具有保护性的、可预测的功能丧失变异,强调了它们是潜在的药物靶点。我们利用信使RNA表达、剪接和预测的编码效应来鉴定16个假定的致病基因,其中许多与脂质代谢有关。我们分析了35559名冰岛人的4907种血浆蛋白水平和47151名英国生物银行参与者的1459种蛋白水平,确定了与疾病发病有关的多种蛋白。我们表明蛋白质组学可以区分NAFL和肝硬化。本研究为NAFL的无创评估和新的治疗方案的发展提供了见解。
论文ID
原名:Multiomics study of nonalcoholic fatty liver disease译名:非酒精性脂肪性肝病的多组学研究期刊:Nature GeneticsIF:41.307发表时间:2022.10通讯作者:Gardar Sveinbjornsson,Kari Stefansson通讯作者单位:冰岛大学医学院
实验设计
实验结果
我们从UKB的36116名欧洲血统英国人的原始腹部磁共振(MR)图像中提取了肝脏质子密度脂肪分数(PDFF)(图1和方法)。使用两种采集技术生成MR图像,即使用梯度回波(GRE)的8448张图像和使用回波不对称和最小二乘估计(IDEAL)的水和脂肪迭代分解的27668张图像。20.0%的IDEAL图像与23.6%的GRE图像的PDFF>5%表明两种方法的结果相似。在270名(IDEAL)和97名(GRE)确诊为NAFL的患者中,179名(66.3%)和76名(78.4%)的PDFF>5.0%(补充图1)。我们的PDFF估计值与其他人使用LiverMultiScan计算的3869个PDFF测量值很好地相关(r2=0.96)(补充图2)。我们使用每个人的首次可用MRI测量,对PDFF估计值(n=36116)进行了GWAS。我们还对临床诊断的NAFL(国际疾病分类,第10版(ICD-10),代码K76.0)的GWAS进行了荟萃分析,包括785例来自冰岛(deCODE遗传学)、5921例来自英国(UKB)、2134例来自美国(Intermountain INSPIRE和HerediGene注册中心)和651例来自芬兰(FinnGen),共9491例NAFL病例和876210例对照。我们将总结级GWAS PDFF数据和NAFL ICD-10代码荟萃分析数据相结合,以最大限度地利用多维度分析来检测关联。
表1.UKB队列中BMI和PDFF高与低的参与者比例
我们在组合GWAS中的17个位点上鉴定了18个独立的序列变体(表2和补充表1),其中4个在NAFL-GWAS(PNPLA2、TOR1B、APOH和GUSB中/附近)中没有报道。基于全基因组关联分析(GWAS),与PDFF和NAFL联合相关的变异在两种表型上名义上都是显著的(P<0.05)。此外,它们对两种表型的影响是可比较的(图2),表明增加PDFF的变异也增加了NAFL的风险,反之亦然。因此,我们将联合表型称为NAFL。与PNPLA3中的错义变体p.Ile148Met的关联最强(p=3.0×10−217,PDFF的影响=0.28 s.d.,P=9.7×10−116 NAFL的比值比(OR)=1.47)。据报道,该变异与NAFLD有关。18个变异中有两个对男性PDFF的影响大于女性,GPAM中的p.Ile43Val(在男性中影响为0.09 s.d.,在女性中影响为0.04 s.d.,Pmales versus females =0.00099)和TM6SF2中的p.Glu167Lys(在男性中影响为0.40 s.d.,在女性中影响为0.28 s.d.,Pmales versus females=7.3×10−5)。 NAFL变异体包括APOH(编码β2糖蛋白1)中的低频(次要等位基因频率(MAF)=2.96%)错义变异体p.Cys325Gly(p=4.0×10−9,对PDFF的影响为0.13 s.d.,NAFL的P=0.02,OR=1.11)。APOH在肝脏中高度表达,p.Cys325Gly与肝酶相关。PNP的最接近同源物,也与NAFL相关(p=4.9×10−12,对PDFF的影响为0.22 s.d.,NAFL的P=0.0013,OR=1.16)。PNPLA2的纯合突变与中性脂质储存疾病有关,脂肪肝是其特征之一。PNPLA2 p.Asn252Lys与腰臀比(WHR)和高密度脂蛋白胆固醇水平增加有关,但与NAFL无关。调整WHR不会影响关联(P=2.4×10−10,对PDFF的影响为0.20 s.d.)。一种常见的NAFL相关变异体,rs6955582[A],GUSB内含子(P=4.7×10−7,对PDFF的影响为−0.038 s.d.,NAFL为P=0.0019,OR=0.95)与GUSB中的错义变体P.Leu649Pro相关(英国为r2=0.87,冰岛为0.99,MAF=44.9%)。TOR1B的内含子变异(MAF=9.23%),rs7029757[A](P=9.2×10−10,对PDFF的影响为为−0.078 s.d.,NAFL为P=0.00028,OR=0.92)也与NAFL相关。据报道,rs7029757[A]与丙氨酸氨基转移酶(ALT)水平和肝硬化有关,但与NAFL无关。 我们还使用ICD-10代码对4809例全因肝硬化(简化为肝硬化;方法)病例(英国ncases=2301,冰岛ncases=691,美国ncases=392,芬兰ncases=1425,ncontrols=967898)和861例肝细胞癌(HCC)病例(英国ncases=374,冰岛ncaes=406,美国ncaes=81,ncontols=819551)进行了meta-GWAS。四种变体与肝硬化相关(表3),其中两种与PDFF相关(补充表2)。与PDFF无关的两个(P>0.19)是HSD17B13中的剪接区变体rs72613567[TA],据报道与NASH相关,以及SERPINA1中的错义变体P.Glu366Lys,其导致α1-抗胰蛋白酶缺乏。 我们比较了UKB数据中18种NAFL变体的PDFF和肝硬化效应。肝硬化效应与PDFF效应成比例(图2),除了ADH1B中的p.His48Arg ADH1B(乙醇脱氢酶1b)和HFE(血色素沉着病)中的p.Cys282Tyr(稳态铁调节剂)。这两种变异体通过乙醇脱氢酶1b(ADH1B)和血色素沉着症(HFE)与肝硬化相关联,而不仅仅是通过肝脏脂肪。类似地,18种变体对HCC的影响与PDFF效应成比例(图2)。表2 .具有NAFL的GWAS(PDFF和NAFL ICD-10代码诊断的组合)a与错义变体
表3 .患有肝硬化的GWAS
2.潜在的因果候选基因
为了确定相关基因座上看似合理的因果基因的优先顺序,我们评估了受铅影响的氨基酸序列、mRNA表达(表达定量性状基因座(eQTL))或剪接QTL(sQTLs)。为了进行这项分析,我们使用了在GWAS中测试的4650万个序列变体的注释,并使用来自全血(n=17846)和脂肪组织(n=770)的内部RNA测序(RNA-seq)数据以及基因型组织表达项目(GTEx,v.v8)中公开的数据来测量mRNA水平。14个铅关联与错义变体或高连锁不平衡(LD;r2>0.8)的变体有错义变体:PNPLA3、APOE、GCKR、GPAM、PNPLA2、TMC4、MTARC1、APOH、ADH1B、HFE、ERLIN1、GUSB和TM6SF2中的两个独立变体。GUSB、TM6SF2、PNPLA3和TMC4中的错义变体与各种组织中相应基因(顺式eQTL)的表达水平相关,TMC4中错义变体也与MBOAT7的肝脏表达相关。MBOAT7的损失与NAFLD相关。这些变异是顶级eQTL,也就是说,它们要么在其基因座上与这些基因的表达水平有最强的关联,要么与之高度相关(r2>0.8)。TOR1B、HSD17B13和GUSB中的变异与全血中的剪接相关,作为顶级sQTL(补充表3)。内含子变体rs7029757[A]位于TOR1B(torsin 1b)第2外显子下游50 bp处,与隐匿剪接相关(P=1.0×10−1493;补充表3)。该变体将外显子2延长50 bp,导致在外显子3中引入过早终止密码子的移码(补充图3)。
我们使用来自冰岛、英国、丹麦(CHB-CVDC/DBDS)的数据和可用的荟萃分析(补充表4),测试了20种NAFL和肝硬化变种与51种与肝功能或NAFLD相关的表型的相关性。所有变种的风险等位基因与至少一种肝酶水平的升高有关(图2和3)。大多数变异与胆固醇和性激素结合球蛋白测量(SHBG)相关,但与NAFL风险等位基因的影响方向不一致(图3)。MTARC1中的错义变体p.Thr165Ala和GPAM中的p.Ile43Val与测试性状的关联具有最大的相似性(图3和图4)。APOH中的错义变体p.Cys325Gly也与房颤风险增加相关(p=3.5×10−9,OR=1.12,ncases=96018),心力衰竭(P=2.4×10−9,OR=1.12,ncases=99214)和较高水平的脂蛋白(a)(Lp(a);P=2.2×10−56,影响为0.10 s.d.)(补充表4)。ADH1B中的p.His48Arg与酒精依赖风险降低相关(p=2.6×10−64,OR=0.31,ncases=60800)。我们比较了酒精性肝病(ALD)诊断和NAFL诊断的变异关联(补充图4)。p.His48Arg是对ALD风险影响显著大于NAFL风险的唯一变异(ncases=3818)(分别为OR=0.33和OR=0.85,p=6.6×10−10)。
4.GPAM和MTARC1中罕见的功能缺失变体
在20个与NAFL和肝硬化相关的GWS变异体中,14个是常见或低频错义变异体(MAF<3%)。尽管这些变异涉及可能的相关基因,但尚不清楚编码蛋白功能的丧失或增加是否会降低或增加疾病风险。为了研究这一点,我们使用冰岛和英国的数据,在这些基因座上寻找与候选致病基因中罕见的预测功能丧失(pLOF)变异的关联。我们测试了47个pLOF变异体与我们在基因座上检测到的领先变异体的相同性状的关联,并在冰岛发现了两个罕见的pLOF变体关联:MTARC1中的p.Arg305Ter(MAF=0.34%)和GPAM中的p.Thr189GlyfsTer5(MAF=0.11%)(补充表5)。这两个基因都编码线粒体酶。MTARC1中罕见的pLOF变异体p.Arg305Ter与较低的总胆固醇水平相关(p=3.2×10−5,影响为−0.18 s.d.)(图4和补充表5),与MTARC1中常见错义变体p.Thr165Ala的保护性等位基因一致。由于预测p.Arg305Ter会降低MTARC1的功能,这表明p.Thr65Ala也通过降低MTARC1功能降低胆固醇水平。因此,其与NAFL风险降低的关联很可能是由MTARC1功能降低所致。我们的发现与MTARC1中另一种蛋白截短变体p.Arg200Ter的报道一致,该变体名义上与肝硬化风险降低相关。GPAM中常见错义变体p.Ile43Val的次要等位基因与NAFL风险增加和总胆固醇水平升高有关,而罕见的pLOF变体p.Thr189GlyfsTer5与总胆固醇水平降低有关(p=3.5×10−8,影响为−0.41 s.d.),表明p.Thr189GlyfsTer5通过降低GPAM功能降低NAFL风险。尽管这两种pLOF均与NAFL或肝硬化无关,但它们提供了先前报道的相关性是功能增强还是功能丧失的信息。MTARC1的p.Arg305Ter位于该基因的最后一个外显子,我们在RNA数据中没有发现无义介导的衰变的证据(补充图3)。我们还发现GCKR中的pLOF变体,p.Arg540Ter(MAF=0.60%),与甘油三酯水平升高有关(p=6.9×10−7,影响为0.16 s.d.),类似于GCKR常见错义变体p.Leu446Pro的NAFL风险增加等位基因。
5.变量-变量和变量-BMI相互作用
HSD17B13中的rs72613567[TA]和PNPLA3中的p.Ile148Met在它们对肝酶的影响中相互作用。我们复制了HSD17B13中rs72613567[TA]与PNPLA3中p.Ile148Met之间的相互作用(p = 9 × 10−15和2.9 × 10−12)分别对应天冬氨酸转氨酶(AST)和谷丙转氨酶(ALT)(补充图5)。这两种变异在NAFL和HCC诊断中的相互作用也很显著(P = 0.00073和P = 0.0020)。PDFF和体重指数(BMI)相关(r2=0.32),只有2%的人PDFF高(>5%),BMI低(<25 kg m−2)与高PDFF和高BMI的19%相比(≥25 kg m−2)(表1和图1)。在20个NAFL和肝硬化变种中,只有APOE中的p.Cys130Arg和ADH1B中的p.His48Arg与BMI相关(补充表4,nBMI测量值=486305)。PNPLA3、TM6SF2、APOE和GUSB的错觉变异与BMI相互作用,影响PDFF(P<0.05/20;补充表6和补充图6)。没有一种变异与年龄相互作用影响PDFF(补充图7)。在英国皇家医学院的参与者中,2795人相隔2-3年各拍摄了2张肝脏MR图像。连续PDFF测量值与BMI测量值(r2=0.60)相关(补充图8和9)。PDFF和BMI的变化密切相关(P=2.8×10−104),两种测量的平均变化方向相同(补充图10)。我们发现PNPLA3中的p.Ile148Met与BMI变化之间存在名义上显著的相互作用(p=0.030;补充图11)。此外,p.Ile148Met携带者PDFF变化的差异比非携带者更大(p=0.0055;补充图12),且基因型和BMI变化之间的相互作用不能完全解释(经BMI变化调整的Padj=0.032)。
6.与循环蛋白水平整合
为了深入了解影响NAFL或肝硬化发病机制的蛋白质,并寻找相关的生物标志物,我们使用Olink Explore 1536对来自英国的47151名欧洲血统参与者进行了35559名冰岛人和1459名免疫测定,分析了SomaScan v.4使用4907适配体测得的蛋白质水平。在冰岛或英国,2741种蛋白的水平(经Bonferroni调整后)与NAFL(nCeland=234例,nUK=572例)x相关以及948种蛋白与肝硬化(nCelland=111例,nUK=303例)相关。我们寻找了20种NAFL与肝硬化变异和蛋白质水平之间的关联。使用冰岛(SomaScan)或UKB(Olink)作为顶级蛋白QTL(pQTL),16种变体与一种或多种反式蛋白的水平相关(补充表7)。GCKR和SERPINA1中的反式pQTL是非特异性的,因为它们分别与396和172个蛋白质相关。针对与少于100个蛋白质相关的变体,我们鉴定了273个与反式变体相关的蛋白质(即,与编码靶蛋白的基因不同染色体位置的变体),其中26个与SomaScan和Olink测量值相关。十种蛋白质的水平与五种或多种变体相关(SMPDL3A和NAAA蛋白具有八种变体;SMPD1和GUSB蛋白具有七种变体;KRT18、HEXB、GSTA1、ENTPD5、CTSO和ACY1蛋白具有五种变体)(补充图15),这十种蛋白质中有八种与NAFL或肝硬化相关(补充表8-10)。PNPLA3中的错义变异体p.Ile148Met是86种蛋白质的顶级反式pQTL,其中醛酮还原酶超家族7A3亚型(AKR7A3)在冰岛(SomaScan)中表现出最显著的相关性(p=3.1×10−12,影响为0.07 s.d.)和角蛋白18(KRT18)(P=8.4×10−38,影响为0.10 s.d.)。HSD17B13中的rs72613567[TA]与冰岛(SomaScan)的DnaJ B成员同源亚家族9蛋白(DNAJB9)和英国(Olink)的羧酸酯酶3(CES3)的水平最显著相关。MTARC1(p.Thr165Ala)和GPAM(p.Ile43Val)中的错义变体均与冰岛(SomaScan)测量的XIIB组分泌型磷脂酶A2样蛋白(PLA2GXIIB)水平有关,与UKB(Olink)测量的无活性Cα-甲酰甘氨酸生成酶(SUMF2)、缺氧上调蛋白1(HYOU1)和酸性鞘磷脂酶样磷酸二酯酶3a(SMPDL3A)水平相关。PLA2GXIIB在肝脏中高度表达,这些变体的NAFL保护等位基因与较低的蛋白质水平相关(MTARC1和GPAM变体分别为P=9.3×10−12,效果=−0.062 s.d.,P=2.4×10−14,效果=−0.072 s.d.)。此外,冰岛GPAM和MTARC1中罕见的pLOF变异均与较低的PLA2GXIIB蛋白水平相关(P=7.4×10−4,效果=−0.44标准差。P=0.013,效果=−分别为0.19s.d.)。我们注意到,其他NAFL变体名义上与PLA2GXIIB相关,一些与GPAM和MTARC1中的LOF变体的作用方向相反(补充图13)。因此,为了探索血浆中测定的任何蛋白质是否可能在疾病中起因果作用,我们使用每种蛋白质的全反式pQTL进行了孟德尔随机化。转铁蛋白受体蛋白1(TFRC)的pQTL效应与其对PDFF的影响成正比(Pivw-olink=5.6×10−10,Pivw somascan=2.0×10−4补充图13和补充表11),表明TFRC可能在NAFL中具有因果作用。除TFRC外,分析表明血浆中蛋白质水平的变化不是因果关系,而是疾病的结果,因为对于许多蛋白质而言,NAFL变体对PDFF的影响与其对蛋白质水平的影响成正比(补充表12)。我们使用PANTHER v.16.0工具进行了路径分析,以寻求对变种-肝病关联的理解。与NAFL变异体相关的273个蛋白质被富集用于多种代谢和分解代谢过程,包括激素、脂质、酒精、维生素、类固醇和单羧酸的代谢以及其他途径和生物过程(补充表13)。最后,我们比较了肝硬化患者和NAFL患者的血浆蛋白质组(补充表10和补充图14)。在冰岛(SomaScan),NAFL和肝硬化之间最显著的差异首先是钙调素2(CSTN2,P=3.6×10−17,影响为0.92 s.d.),其次,胰岛素样生长因子结合蛋白(IGFBP)2(P=5.9×10−17,影响为0.92 s.d.)。与人群对照组相比,肝硬化患者的IGFBP2水平升高,但NAFL患者的水平降低。使用UKB(Olink),NAFL和肝硬化之间最显著的差异首先是血栓反应蛋白2(THBS2,P=6.6×10−114,影响为1.59 s.d.),其次,IGFBP7(P=1.3×10−89,影响为1.35 s.d.)。使用SomaScan和Olink测量THBS2、IGFBP7和IGFPB2的水平,并在两个数据集中关联。对于NAFL,与人群相比,氨基酰化酶-1(ACY1)在冰岛和英国表现出最强的相关性(补充表8-10)。为了研究血浆蛋白是否能有效区分NAFL和肝硬化,我们使用肝酶、年龄、性别和BMI作为基线,并使用血浆蛋白组和遗传风险评分(GRS)训练了惩罚逻辑回归模型。在冰岛(SomaScan)和英国(Olink),用血浆蛋白质组训练的模型在区分NAFL和肝硬化、NAFL与人群、肝硬化和人群方面优于其他模型(图5和补充表14-17)。
讨论
https://doi.org/10.1038/s41588-022-01199-5
----------微科盟更多推荐----------
科研 |海军军医大学:KAT7介导的乙酰化修饰调控肝癌新机制(国人佳作)
科研 |深圳技术&西南民族:蛋白质组学揭示传统草药余甘子抗肝纤维化的多靶点机制(国人佳作)
如果需要原文pdf,请扫描文末二维码领取
请关注下方公众号
了解更多蛋白质组知识